Эксплуатация Arenadata Hadoop

25-29 августа
22-26 сентября
17-21 ноября
22-26 декабря

Курс «Эксплуатация Arenadata Hadoop» поможет вам получить актуальные знания по работе с Arenadata Hadoop и успешно применять их на практике

Преимущества курса

Курс единственного в мире вендора-разработчика открытого дистрибутива Hadoop

Arenadata — единственный вендор, который на базе Apache Hadoop разрабатывает собственный дистрибутив, адаптированный для корпоративного использования и предназначенный для хранения и обработки слабоструктурированных и неструктурированных данных.

Только применимые на практике знания

В рамках курса слушатели получат теоретические знания и практический опыт:

  • по планированию и развёртыванию распределённых вычислительных кластеров Hadoop на базе дистрибутива Arenadata Hadoop версии 2 и системы управления Arenadata Cluster Manager;
  • работе с продуктами экосистемы Hadoop;
  • мониторингу и оптимизации производительности системы;
  • обслуживанию и аварийному восстановлению узлов кластера и отдельных компонент.

Сертификация

  • Слушателям, успешно прошедшим сертификацию, выдается именной вендорский сертификат.
  • Слушателям курса предоставляется 2 попытки для прохождения проверки знаний.

Что представляет собой курс

«Эксплуатация Arenadata Hadoop» — 5-дневный практический курс по администрированию, установке и настройке кластера Hadoop под управлением Arenadata Cluster Manager. В рамках данного курса участники получат теоретические знания и практический опыт по:

  • планированию и развертыванию распределенных вычислительных кластеров Hadoop на базе дистрибутива Arenadata Hadoop версии 2 и системы управления Arenadata Cluster Manager;
  • работе с продуктами экосистемы Hadoop;
  • мониторингу и оптимизации производительности системы;
  • обслуживанию и аварийному восстановлению узлов кластера и отдельных компонент.

Аудитория курса

Курс будет интересен системным администраторам Hadoop, которые хотят получить знания по продуктам экосистемы Hadoop и продвинутые навыки по установке, конфигурированию, обслуживанию, восстановлению и управлению кластером Hadoop с использованием дистрибутива Arenadata Hadoop и системы управления Arenadata Cluster Manager.

Как проходит курс

Занятия проходят удаленно с отрывом от производства. Курс проводится в формате вебинара: вас ждет общение с преподавателем, лекционная часть, практические работы на виртуальных машинах и разбор лабораторных работ, сессия вопросов-ответов с практиками из Arenadata. Время занятий с 10:00 до 18:00 мск. Группы набираются в двух форматах:

  • Корпоративные (заказчик записывает на курс команду от 10 человек, даты занятий согласуются отдельно)
  • Открытые (смешанные группы, в которые входят представители нескольких компаний, такие занятия проходят по расписанию)

Сертификация

  • Слушателям, успешно прошедшим сертификацию, выдается именной вендорский сертификат.
  • Слушателям курса предоставляется 2 попытки для прохождения проверки знаний.
сертификат

Программа обучения

Модуль 1

Приветствие

Модуль 2

Введение в экосистему Hadoop

  • История возникновения Hadoop.
  • Понятия BigData, Data Lake.
  • История проекта.
  • Основные компоненты и экосистема.
  • Основные проекты Hadoop. HDFS, MR, YARN, Hive, Tez, HBase, Phoenix, Solr, Spark, Zookeeper, Impala, HUE, Kyybi.
  • Дистрибутивы Hadoop.
  • Проект ODPi. Arenadata Hadoop.
  • Проект Ambari. ADCM.
  • Архитектура кластера Hadoop.
  • HDFS. YARN.
  • Отказоустойчивость.
Модуль 3

Подготовка окружения к установке Hadoop

  • Планирование кластера.
  • Типы узлов. Профили нагрузки.
  • Аппаратное обеспечение. Примеры кластеров.
  • Настройка параметров окружения.
  • Подготовка к установке.
  • Настройка сети и DNS. Лабораторная работа.
  • Монтирование и настройка файловой системы.
Модуль 4

Введение в Arenadata Cluster Manager

  • Основные понятия и компоненты.
  • Развертывание системы управления.
  • Подготовка и настройка инфраструктуры с использованием бандла.
  • Планирование и первичная конфигурация кластера Hadoop.
  • Установка и настройка мониторинга.
  • Установка кластера Hadoop.
  • Мониторинг.
  • Подходы к конфигурированию сервисов экосистемы Hadoop.
  • Основные конфигурационные файлы и описание.
  • Работа с логами сервисов, поиск и выявление проблем работы с сервисами.
  • Обзор возможностей ADCM. Интерпретация статусов тестов, сервисов в системе управления ADCM.
Модуль 5

Пост-настройка кластера Hadoop: HDFS, YARN

  • Файловая система HDFS.
  • Основные операции в HDFS.
  • Работа с файлами и каталогами. Balancer.
  • Распределенное копирование. HttpFS.
  • Обслуживание и дианостика HDFS: DataNodes, NameNodes, HA. HDFS UI.
  • Политики хранения. Tiering. Erasure Coding. Rack Awareness.
  • Компрессия и форматы файлов.
  • Парадигма Map Reduce.
  • Архитектура YARN, HA-режим. Работа с YARN UI.
  • Scheduler YARN.
Модуль 6

Проверка работоспособности кластера

  • ZooKeeper. Основные понятия и операции. Работа с Zookeeper CLI.
  • HBase. Основные понятия и примеры операций. Установка и конфигурирование (GC, Memstore, Compression, Load balancing, Flush). High Availability. Работа с утилитами HBase (check, repair).
  • Phoenix. Основные операции с данными.
  • Примеры запросов Hive. Основные понятия и примеры операций. Установка и конфигурирование. High Availability HiveServer.
  • Работа с утилитами Hive (schema-tool). Работа с Tez UI.
  • Оптимизация запросов Hive.
  • Impala. Архитектура и конфигурирование.
  • Spark. Основные понятия и операции.
  • Установка и конфигурирование. Работа со Spark UI. Примеры кода.
  • Работа с Livy сервером (REST API).
  • Kyuubi. Архитектура, подключение и примеры операций. Установка и конфигурирование.
  • HUE. Установка, конфигурирование и обзор UI.

Итоговое тестирование

«Эксплуатация Arenadata Hadoop»

Ближайший старт:

22-26 Сентября

Длительность:

5 дней , 40 ак.ч.

Записаться на курс

Спасибо, что написали нам!

Мы обработаем заявку и свяжемся с вами в ближайшее время.

Будем рады помочь!

Отправьте ваш вопрос через форму ниже, и наши специалисты свяжутся с вами в ближайшее время.

Корпоративная группа *
Фамилия *
Имя *
Должность/Роль в компании *
Эл. почта *
Телефон *
Наименование компании *
Опишите ваш вопрос
ошибка! проверьте правильно ли вы заполнили поля

Остались вопросы?

Если вы не нашли ответа на свой вопрос, вы можете воспользоваться формой обратной связи

хочу спросить

Как проходит обучение

Обучение проходит дистанционно в формате вебинаров. Теория перемежается с лабораторными работами, стенд разворачивается для каждого участника, с преподавателями можно общаться на протяжении всего обучения как голосом, так и в чате.

Занятия проводятся с отрывом от производства.

Время проведения занятий с 10:00 до 18:00 мск, если курс рассчитан на целый день.

Корпоративное обучение

Если ваша компания планирует внедрять решения Arenadata или уже работает с ними, вы можете воспользоваться возможностями корпоративного обучения и записать на интересующий курс команду от десяти человек.

Открытые группы

Периодически обучение проходит в смешанных открытых группах. Если вы планируете обучить менее 10 сотрудников, то смело записывайтесь в одну из них. Ориентироваться можно на расписание ниже.

Оставьте заявку на обучение и мы расскажем вам подробнее о том, как набирается группа и сколько свободных мест осталось.

Что получает слушатель по окончанию занятий

После успешной сдачи итогового тестирования, участникам выдается именной вендорский сертификат.

Хотите записаться на курс?

Да, хочу!

Этот сайт использует cookie-файлы и другие технологии, чтобы помочь вам в навигации, а также предоставить лучший пользовательский опыт, анализировать использование наших продуктов и услуг, повысить качество рекламных и маркетинговых активностей.